導讀:"網(wǎng)絡蜘蛛" 學名Spider,又叫"網(wǎng)絡爬蟲"! 關于網(wǎng)絡蜘蛛的概述這里就不多講了,今天我主要想說的是關于蜘蛛的爬行設計的方式與方法。我們可以分為2種:那么什么是深度優(yōu)先? 什么
發(fā)表日期:2019-05-08
文章編輯:興田科技
瀏覽次數(shù):12783
標簽:
"網(wǎng)絡蜘蛛" 學名Spider,又叫"網(wǎng)絡爬蟲"! 關于網(wǎng)絡蜘蛛的概述這里就不多講了,今天我主要想說的是關于蜘蛛的爬行設計的方式與方法。
我們可以分為2種:
那么什么是深度優(yōu)先? 什么是廣度優(yōu)先?有什么用? 上海SEO (SWJ) 下面為大家講解!本人學知淺薄只會用通俗的話與道理與大家分析,如有錯誤請及時聯(lián)系我 所以還請大家多多見諒包含!
一種是深度優(yōu)先策略,一種是廣度優(yōu)先策略! 以下我們就圍繞這2點進行分析SWJ非常歡迎大家一起交流、學習與探討!
深度優(yōu)先顧名思義就是讓網(wǎng)絡蜘蛛盡量的在抓取網(wǎng)頁時往網(wǎng)頁更深層次的挖掘進去 講究的是深度!也泛指: 網(wǎng)絡蜘蛛將會從起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路之后再轉(zhuǎn)入下一個起始頁,繼續(xù)跟蹤鏈接!
以下我發(fā)張圖 大家看下: (下面這張是 簡單化的網(wǎng)頁連接模型圖 其中A為起點 也就是蜘蛛索引的起點!)
總共分了5條路徑 供蜘蛛爬行! 講究的是深度!
(下面這張是 經(jīng)過優(yōu)化的網(wǎng)頁連接模型圖! 也就是改進過的蜘蛛深度爬行策略圖!)
根據(jù)以上2個表格 我們可以得出以下結(jié)論:
圖1:路徑1 ==> A --> B --> E --> H 路徑2 ==> A --> B --> E --> i
路徑3 ==> A --> C 路徑4 ==> A --> D --> F --> K --> L
路徑5 ==> A --> D --> G --> K --> L
經(jīng)過優(yōu)化后
圖2: (圖片已經(jīng)幫大家標上方向了!)
路徑1 ==> A --> B --> E --> H 路徑2 ==> i
路徑3 ==> C 路徑4 ==> D --> F --> K --> L 路徑5 ==> G
深度爬行的優(yōu)點是:網(wǎng)絡蜘蛛程序在設計的時候相對比較容易些把 其他我也沒發(fā)覺有什么優(yōu)點... 還有就是 蜘蛛的這種 "勇往直前"的精神 值得學習下! ^_^
深度爬行的缺點是:缺點么多了一點點 呵呵! 每次爬行一層總要向"蜘蛛老家" 數(shù)據(jù)庫訪問一下。問問老總有必要還要爬下一層嗎! 爬一層 問一次.... 引用一句高人的話 如果一個蜘蛛不管3721不斷往下爬 很可能迷路更有可能爬到國外的網(wǎng)站去.. 本來目標是中文網(wǎng)站 因為Ip的問題 國外Ip做了中文站的話.... 就容易去別人"老家"了..這樣不僅增加了系統(tǒng)數(shù)據(jù)的復雜度更是增加的服務器的負擔 我想沒有一家搜索公司會愿意則樣的把,...除非腦子"秀"了 .. ^_^
接下來 我們介紹下普遍使用的 廣度優(yōu)先策略 大家休息下 喝杯咖啡 看的也累把 我寫的也累.... ^^
廣度優(yōu)先在這里的定義就是層爬行。什么叫蜘蛛層爬行?就是一層一層的爬行 按照層的分布與布局 去索引處理與抓取網(wǎng)頁! 當然SE不會派一個蜘蛛去的 每層會派一個或多個蜘蛛Spider去抓取內(nèi)容!
(下面這張就是 廣度優(yōu)先策略圖(層爬行圖))
大家一看就明白了把 聰明的人 下面的文章也不需要看了 答案已經(jīng)告訴你了 ^ ^
根據(jù)以上表格 我們可以得出以下結(jié)論路徑圖:
路徑1 ==> A 路徑2 ==> B --> C --> D 路徑3 ==> E --> F --> G
路徑4 ==> H --> i --> K 路徑5 ==> L
廣度爬行的優(yōu)點是:廣度相對深度 對數(shù)據(jù)抓取更容易控制些! 對服務器的負栽相應也明顯減輕了許多! 爬蟲的分布式處理 使的速度明顯提高! 其他的想也可以想到拉!
廣度爬行的缺點是:暫時還沒觀察到有什么缺點 呵呵 就好比 p+CSS樣式表(層布局)一樣道理 你覺得有什么缺點嗎?難道是新人不會這個問題? ^ ^不會不要緊 下載這本電子書去看看 <> 下載地址: http://www.seo-sh.cn/zl/seoqita/122.html
其他還有什么建議意見 請多多指教與批評 上海SEO負責人SWJ 非常歡迎各位SEO愛好者 一起交流 學習與探討SEO優(yōu)化技術(shù),網(wǎng)站策劃也可以 ^_^ 聯(lián)系方式見首頁底部!
轉(zhuǎn)自上海SEO http://www.seo-sh.cn
上一篇:
網(wǎng)站更新與關鍵詞排名上一篇:
對百度蜘蛛對TITLE處理的思考!更多新聞
2023
如果您打算在豐城開展在線銷售業(yè)務,我們的電子商務解決方案將能夠幫助您實現(xiàn)這一目標。我們的團隊將為您構(gòu)建一個安全、易于管理和具有可擴展性的電子商務平臺,使您能夠便捷地管理產(chǎn)品、處理訂單和交付貨物。
View details
2023
您可以使用網(wǎng)站分析工具,如Google Analytics,來跟蹤您的網(wǎng)站流量、訪客來源和行為。通過分析這些數(shù)據(jù),您可以了解您的網(wǎng)站性能,并作出相應的改進。
View details
2023
網(wǎng)絡廣告投放是一種通過購買廣告位,在適當?shù)臅r間和適當?shù)奈恢谜故緩V告以吸引潛在用戶的方式。可以選擇在七臺河各大門戶網(wǎng)站、搜索引擎或社交媒體平臺等進行廣告投放,增加品牌知名度和銷售業(yè)績。
View details
2023
搜索引擎優(yōu)化(SEO)是提高網(wǎng)站在搜索引擎結(jié)果頁面上的排名的關鍵。通過優(yōu)化您的網(wǎng)站內(nèi)容、關鍵詞和標簽等,可以提高搜索引擎對您網(wǎng)站的可見性。關鍵詞“佳木斯網(wǎng)絡推廣”可在您的網(wǎng)站內(nèi)容中使用,以增加與佳木斯地區(qū)相關的搜索流量。
View details